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Ligandenbestimmung f iir Proteine 



Die vorliegende Erfindung betrifft ein Verfahren zur Bestim- 
mung von Liganden fiir Proteine gemaB den Merkmalen des Pa- 
tentanspruches 1. 

In der Biochemie versteht man unter Liganden biologische 
aktive Substanzen meist niedermolekularer Art, die durch Bin- 
dung an eine spezifische Bindungsstelle eines Makromolekiils 
eine bestimmte Wirkung auf das Makromolekiil ausiiben. Bei den 
hier betreffenden Makromolekiilen kann es sich um Enzyme, Re- 
zeptoren, DNA, RNA usw. handeln. 

Durch Bindung des Liganden an das Makromolekiil konnen bei- 
spielsweise der katalytische Umsatz eines Enzyms, die Akti- 
vierung bzw. Inaktivierung eines Enzyms sowie Konformations- 
anderungen von Makromolekiilen bewirkt werden. 

In der pharmazeutischen Industrie werden bisher zwei Strate- 
gien zur Identif izierung biologischer aktiver Substanzen, 
d.h. Liganden, angewandt. 

Die Unternehmen verfiigen in der Regel iiber gro3e Substanz- 
sammlungen vieler verschiedener Einzelverbindungen . Diese 
Substanzen werden in biologischen Systemen, z.B. Zellassays, 
mittels Hochdurchsatzverf ahren in Form von PipettierstraBen 
mit automatischer Auswertung auf bestimmte Aktivitaten gete- 
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stet. Treffer bei diesen Verfahren sind allerdings nur zufal- 
lig, sie treten aber mit bestimmten Wahrscheinlichkeiten auf . 



Die Alternative dazu ist eine andere Strategie, die mit Hilfe 
von Computern durchgef uhrt wird. Unter Berechnung der Krafte 
zwischen Molekiilen werden am Computer Verbindungen, die an 
bestimmte Proteinoberf lachen binden sollen, virtuell erstellt 
und dann erst synthetisiert . So werden im Gegensatz zum obi- 
gen verfahren weniger Substanzen synthetisiert und getestet. 
Es werden auch virtuelle Substanzbibliotheken von Molekiilen, 
die nicht als Substanz vorliegen miissen, im Dockingverf ahren 
am Computer auf eine Bindung an eine bestimmte Proteinober- 
flache getestet. Wiederum werden dann nur die Treffer synthe- 
Atisiert und in biologischen Testsystemen eingesetzt. Verfah- 
ren dieser Art sind bereits in den US-Patenten 5,495,423, 
5,579,250 und 5,612,895 beschrieben worden . 

In der Praxis, wurden auch Kombinationen der oben beschriebe- 
nen Verfahren angewendet. 

Bei diesen Verfahren wurden aber keine in der Natur vorkom- 
menden Inteir^aktionen ausgenutzt. Des weiteren sind viele be- 
kannte Verfahren der Zufalligkeit ausgesetzt und miissen sich 
oftmals auf dVe virtuelle Beobachtung stiitzen. Dieses fiihrt 
zu betrachtliclren Zeitverlusten und Urigenauigkeiten . 



Es ist daher Auf gabe • der vorliegenden Erfindung, ein Verfah- 
ren zur Verfiigungr zu stellen, bei dem die Liganden fur Pro-, 
teine schnell undl zuverlassig bestimmt werden konnen. 

Die Aufgabe wird ^it einem Verfahren gema3 Patentanspruch 1 
gelost. \ 



Die Unteranspriichfe betreffen bevorzugte Ausf iihrungsf ormen des 
erf indungsgemaBen) Verfahrens. 



Die Erfindung be1 
f indungsgemaBen 



-rifft weiterhin Liganden, die nach dem er- 
^erfahren hergestellt sind. 



ali/15.7.98 



Das erf indungsgemaBe Verfahren zur Bestimmung von Liganden 
fur Proteine umfaSt folgende Schritte: 

a) Bestimmung der Sekundarstrukturelemente eines gegebenen 
Proteins, die den Bindungsort fiir den Liganden bilden; 

b) Zerlegung der molekularen Oberflache eines gegebenen Pro- 
teins in molekulare Oberf lachenteile; 

c) Bestimmen von ahnlichen Flachen zu denjenigen Elementen, 
die die zu bestimmende Bindungsregion fiir den Liganden 
definieren, wobei die gefundenen molekularen Oberf lachen- 
teile ein komplementares Nachbarelement besitzen; 

d) Koordinatentransf ormation des gefundenen molekularen 
Oberf lachenteils mit Nachbarelement auf ein Ausgang- 
selement bei einem rms-Wert unterhalb von 2A und 

e) Beurteilung der PaSfahigkeit des Liganden gema£ lokaler 
Packungsdichte . 

Der Ablauf des erf indungsgema£en Verfahrens wird anhand des 
in Fig. 1 gezeigten FlieBdiagramms erlautert. 

Vorzugsweise wird das erf indungsgemaBe Verfahren auf der 
Grundlage einer Datenbank durchgef iihrt • Es hat sich als 
zweckmaBig erwiesen, die Datenbank 11 Dictionary of Interfaces 
in Proteins (DIP) 1 1 zu verwenden, die in J.Mol.Biol. (noch 
nicht verof f entlicht) beschrieben ist. Die Datenbank DIP 
stellt Flachen zwischen Sekundarstrukturen (SSE) aller struk- 
turell bekannten Proteine zur Verfugung. Diese Interfaces 
bestehen aus zwei Atommengen (Patches) , die Teile von benach- 
barten Sekundarstrukturen sind und zusammen den Kontakt 
dieser beiden Strukturen ausmachen. 

Bei der Bestimmung von Liganden, dem sogenannten ''drug 
design", stellt sich die Frage, welche chemische Verbindung 
zu einer gegebenen Proteinstruktur pa6t. Erf indungsgemaB wer- 
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den die Sekundarstrukturelemente eines gegebenen Proteins, 
die den Bindungsort fiir den Liganden bilden, bestimmt, Dann 
wird die molekulare Oberf lache eines gegebenen Proteins zu- 
nachst in molekulare Oberf lachenteile (MSP = molecular sur- 
face patches) zerlegt. Zu denjenigen Elementen, die poten- 
tiell die Bindungsregion definieren, werden beispielsweise 
aus der oben beschriebenen Datenbank ahnliche Flachen heraus- 
gesucht. Als Nebenbedinung wird bei dem Screening auf Ahn- 
lichkeit verlangt, daB die gefundenen MSPs bereits ein kom- 
plementares Nachbarelement besitzen. Eine Transformation, 
beispielsweise Koordinatentransf ormation, des gefundenen MSP 
mit Nachbarelement auf das Ausgangselement ist dann aus- 
sichtsreich, wenn der rms-Wert (mittlerer Fehler) unterhalb 
von 2A liegt. Vorzugsweise liegt der Wert bei 1,5 A. Fiir die 
Beurteilung der PaBfahigkeit des Liganden gegeniiber dem Ori- 
ginal hat sich die lokale Packungsdichte nach Goede et al. 
bewahrt . 

Bei dem erf indungsgemaBen Verfahren sollen die AuBenflachen 
der Sekundarstrukturen bestimmt werden. Die AuBenflachen, die 
den Kontakt herstellen, sind die molekularen Oberf lachenteile 
(MSP) . Ahnliche molekulare Oberf lachenteile werden iiberla- 
gert. Nach der Koordinatentransf ormation liegen die gefunde- 
nen molekularen Oberf lachenteile auf Atomen des Bindungsor- 
tes. Die besten potentiellen Liganden bilden die Leitverbin- 
dung. Der Vergleich der besten potentiellen Liganden mit 
einem bekannten Ausgangsprotein plus Ligand erfolgt als letz- 
tes • 

Somit erfolgt erf indungsgemaB die Bestimmung eines komplemen- 
taren Bindungspartners dadurch, indem ahnliche Elemente be- 
stimmt werden, die bereits einen Bindungspartner besitzen. 

Wenn die Liganden, wobei es sich urn Sekundarstrukturelemente 
aus ca. 10 Aminosauren handelt, bestimmt sind, mussen sie fiir 
den Einsatz als Pharmakon noch optimiert werden, da Peptide 
aus den natiirlichen L-Aminosauren vielen Anf orderungen nicht 
entsprechen - 
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Es gibt exper imentelle Verfahren zur synthetischen Umwandlung 
von Peptiden in Peptidmimetika , z.B. Peptoide, die vom phar- 
makologischen Standpunkt aus betrachtet, haufig wesentlich 
gunstigere Eigenschaf ten aufweisen. Die Verbindungen durch- 
laufen dabei in der Regel verschiedene Optimierungszyklen, in 
denen die Molekule auch wirklich als Substanzen vorliegen. 

Eine weitere Moglichkeit, Leitverbindungen zu finden, besteht 
in der Suche in Datenbanken niedermolekularer Verbindungen. 
In diesem Falle werden die Koordinaten des entsprechenden 
passfahigen Peptids oder Teile davon verwendet, um in einer 
entsprechenden Datenbank nach dem angegebenen Uberlagerungs- 
verfahren ( Vergleichsverf ahren) zu suchen. Damit ist es mog- 
lich, vollig unabhangig von der peptoiden Grundstruktur 
Leitverbindungen zu finden. 

Das erf indungsgemaBe Verfahren zur Bestimmung von Liganden 
wird vorzugsweise fur die aktiven Zentren von Enzyxnen be- 
schrieben. Das Verfahren ist allerdings auch auf andere 
Makromolektile (Proteine, DNA , RNA ) iibertragbar, sofern sie 
geeignete Oberf lachen besitzen. Folgende Anwendungsgebiete 
kommen beispielsweise in Betracht: 

* Bindungs- und/oder Nachweismolekiile in diagnostischen 
Assays 

* Lebensmittelindustrie : Suche von Liganden fiir Geschmacks- 
rezeptoren und Vervendung als Geschmackszusatzstof f 

* Biotechnologie : Molekule fiir die Af f initatsreinigung 

* Proteine, die im therapeutischen Bereich gebunden werden 
mussen: Enzyme, Rezeptoren, DNA, RNA 

Zytokine oder Wachstumsf aktoren und ihre 
Rezeptoren, insbesondere diejenigen, die der 
Stof fwechselregulation dienen 
Zelladhasionsproteine und ihre Rezeptoren 
Proteine der Signaltransduktionswege und ihre 
Bindungspartner 

zytosolische Rezeptoren , Steroidrezeptoren 
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Proteine der Blutgerinnung 

Neurotransmitter und ihre Rezeptoren 

Proteine der Stof fwechselwege 

Proteine der Replikation, Transkription und 

Translation 

Proteine von Krankheitserregern (Bakterien, 
Viren, eukaryotische Einzeller, Parasiten) 

Das erf indungsgemaBe Verfahren laBt sich auch zur Bestimmung 
von Proteinstrukturen anwenden. Es ist nicht auf alleinige 
Sequenzahnlichkeit angewiesen, sondern verwendet Strukturahn- 
lichkeit von molekularen Grenzflachen von Sekundarstruktur- 
elementen zur Vohersage ihrer Wechselwirkungspartner . Dabei 
wird der Tatsache Rechnung getragen, da/3 gleiche (ahnliche) 
Grenzflachen auch bei unterschiedlichen Sequenzen entstehen 
konnen . 

Beispielhaft soil im folgenden das Verfahren der Protein- 
s tr uktur be s t immung in seinen Schritten geschildert werden. 

Im ersten Schritt wird eine gegebene Primarstruktur in ihrer 
vollen Lange in eine repetitive Sekundarstruktur 

1 'gewickelt 1 1 . Dies bedeutet, da/3 mit Standard (J>, (p und 
keln B-Faltblatter bzw, a-Helices iiber die voile Lange der 
Primarstruktur errechnet werden. 

Im zweiten Schritt werden die entstandenen molekularen Grenz- 
flachen dieser Sekundarstrukturelemente geclustert und mit 
einem artif iziellen neuronalen Netz bewertet , dessen Ein- 
gangsdaten sich aus den molekularen Oberflachen der ge- 
clusterten Strukturelemente ergeben. Die Bewertung erfolgt 
mit dem Ziel, einerseits zu bestatigen, ob uberhaupt mit der 
gegebenen Primarstruktur molekulare Oberflachen bei dem 
Sekundarstrukturelement zu gestalten sind, die reprasentativ 
fur das gegebene Strukturelement sind. Wenn nicht, wird die 
Sekundarstruktur verworfen. Damit ergibt sich ein neues Ver- 
fahren der Sekundarstrukturvorher sage . Das neuronale Netz 
wird anhand der bekannten Proteinstrukturen trainiert. 
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Alternativ zur allgemeinen Strukturbildung auf der Grundlage 
von Standard <{>, (p und x~ w inkeln fur Helices bzw. Faltblattern 
konnen bekannte Sekundarstrukturvorhersagealgorithmen ange- 
wendet werden, so daB das vorgenannte Verfahren nur auf die 
vorhergesagten Strukturen (Teile der Sequenz) angewandt wird. 
In einem weiteren Schritt werden die gefundenen Cluster, die 
Kontakt zu einem bestimmten Sekundarstrukturelement (oder 
Solvent) haben, verwendet, um in der Datenbank DIP gleiche 
oder ahnliche molekulare Oberf lachen und deren Nachbarn zu 
suchen. Dies geschieht mit dem weiter oben schon beschriebe- 
nen bias-freien Uberlagerungsalgorithmus fiir atomare Sets. 

Aus dem vorgenannten Arbeitsschritt ergeben sich eine Reihe 
von molekularen Oberf lachen (MPS) , deren Partnerelement 
sicher bzw. weniger sicher ( Variantenplanung) festliegt. Wird 
dabei ' 1 nicht-Solvent 1 1 vorhergesagt , versucht ein einfacher 
Docking-Algorithmus im dritten Schritt eine passende Flache 
in anderen Sekundarstrukturelementen als dem direkt betrach- 
teten zu lokalisieren . Der einfache Docking-Algorithmus 
beruht auf der Tatsache, daB molekulare Grenzf lachenpartner 
zwischen Sekundarstrukturen innerhalb eines gegebenen Abstan- 
des der beiden Schwerpunkte bzw. einem bestimmten Winkel der 
ausgezeichneten Richtung gesucht werden kann. Die Qualitat 
der PaBfahigkeit wird mit Hilfe der molekularen Dichtebe- 
stimmung iiberpriift (Goede et al. Journal of Computational 
Chemistry, Bd. 18, Nr. 9, S. 1114ff, 1997). Liegen die poten- 
tiellen Partner fest, wird in einem vierten Schritt die 
prinzipielle Faltbarkeit unter Einhaltung aller vorhergesag- 
ten Nachbarschaf ten (Solvent, Helix-Helix, Helix-coil, Helix- 
extended) iiberpriift und die allgemeine Faltung oder mehrere 
Varianten von der gegebenen Sequenz angenommen. 

Das folgende Beispiel soil das erf indungsgemafie Verfahren 
erlautern . 
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Beispiel 

Inhibitor-Design fur das Proteasom 

Ausgehend von einem Bindungsort einer aktiven Untereinheit 
des Proteasoms bei Hefe werden die Sekundarelemente bestimmt, 
die den Bindungsort bilden. Es stellt sich heraus, dafi fiinf 
Elemente beteiligt sind, wobei zwei grofiere Elemente den Bin- 
dungsort bestimmen. AnschlieBend werden die AuBenf lachen die- 
ser Sekundarstrukturen bestimmt. Mit den Teilen der AuBenfla- 
chen, die den Kontakt ausmachen und 12 bis 22 Atome umfassen, 
werden in der DIP-Datenbank ahnliche MSPs gesucht. Die ahnli- 
chen MSPs von einer bestimmten Mindestgiite, wobei mindestens 
70% der Atome iiberlagert sind und der rms-Wert l,oA betragt, 
werden mit den Ausgangsf lachen iiberlagert, wobei die Ami- 
nosauren, die die Gegenseite der MSPs bilden bei der Koordi- 
natentransf ormation der MSPs einbezogen werden. Nach der Ko- 
ordinatentransf ormation liegen die gefundenen MSPs auf den 
Atomen des Bindungsortes , die Gegenseiten der MSPs in der 
Bindungstasche . 

Die Gegenseiten der gefundenen MSPs, die die potentiellen 
Liganden darstellen, werden dahingehend uberpruft, ob sie die 
Bindungstasche ausfullen und ob die Abstande zu den Atomen 
der Bindungstasche groB genug sind. Dafur wird die lokale 
Dichte in der Bindungstasche berechnet. Die besten potentiel- 
len Liganden bilden die Leitverbindungen . 

Ein Vergleich der zehn besten potentiellen Liganden mit einer 
Proteasom-Struktur des Archebakter iums , die mit Ligand vor- 
liegt, ergibt, da£ die Hauptkette von einer der auf diese 
Weise berechneten Strukturen vollig identisch zu dem bekann- 
ten Inhibitor des Proteasoms des Archebakter iums ist. 
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PAT ENT AN S PRUCH E 

1. Verfahren zur Bestimmung von Liganden fiir Proteine, das 
folgende Schritte umfaBt: 

a) Bestimmung der Sekundarstrukturelemente eines gegebenen 
Proteins, die den Bindungsort fur den Liganden bilden; 

b) Zerlegung der molekularen Oberflache des Proteins in 
molekulare Oberf lachenteile ; 

c) Bestimmen von ahnlichen Flachen zu denjenigen Elementen, 
die die zu bestimmende Bindungsregion fiir den Liganden 
definieren, wobei die gefundenen molekularen Oberflachen- 
teile ein komplementares Nachbarelement besitzen; 

d) Koordinatentransf ormation des gefundenen molekularen 
Oberf lachenteils mit Nachbarelement auf ein Ausgangs- 
element bei einem rms-Wert unterhalb von 2A und 

e) Beurteilung der PaBf ahigkeit des Liganden gemaB lokaler 
Packungsdichte . 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, da!3 
die Aufienf lachen der Sekundarstrukturen bestimmt werden, 

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daB 
die AuSenf lachen , die den Kontakt herstellen, die molekularen 
Oberf lachenteile sind . 

4. Verfahren nach einem der vorangegangenen Anspruche, 
dadurch gekennzeichnet, daB die ahnlichen molekularen Ober- 
f lachenteile mit den Ausgangsf lachen iiberlagert werden. 

5. Verfahren nach einem der vorangegangenen Anspruche, 
dadurch gekennzeichnet, da/3 nach der Koordinatentransf orma- 
tion die gefundenen molekularen Oberf lachenteile auf Atomen 
des Bindungsortes liegen. 

6. Verfahren nach einem der vorangegangenen Anspruche, 
dadurch gekennzeichnet, daB die besten potent iellen Liganden 
die Leitverbindung bilden. 
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7. Verfahren nach einem der vorangegangenen Anspriiche, 
dadurch gekennzeichnet, da3 die besten potentiellen Liganden 
mit einem bekannten Ausgangsprotein plus Ligand verglichen 
werden . 

8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, da6 
die Liganden in Form von Peptiden bestimmt werden. 

9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daB 
das Peptid etwa zehn Aminosauren umfaBt. 

10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daft 
das Peptid anschlieBend in ein Peptidmimetikum umgewandelt 
wird. 

11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daB 
die Proteine Enzyme sind. 

12. Verfahren nach Anspruch 1, dadurch gekennzeichnet, da£ 
der rms-Wert 1 , 5A betragt. 

13. Verfahren nach einem der vorangegangenen Anspriiche, 
dadurch gekennzeichnet, daB es . zur Strukturbestimmung von 
Proteinen angewendet wird. 

14. Verwendung eines nach den Anspruchen 1 bis 12 herge- 
stellten Ligands zur Herstellung eines Pharmakons. 
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Zerlegung des Proteins in 
SekundSrstruktur- 
elemente 




Suche von FlSchen 
zwischen SSEs oder von 
SSEs nach aufcen in der 
Datenbank 




Suche nach ahnlichen 
Protein en 



- MSPs mit 
Nachbar-Sekundarstruktur 
- "Umpflanzen" des 
Nachbar-MSPs in die 
Ausgangsstruktur 
- Bewertung nach Dichte 



Suche nach Proteinen 
Shnlicher Funktion 




Ahnliche 
OberflSchen-MSPs 
>65 % identische Atome 
rms < 1.5A 



Fig. 1 
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